我們知道SVM在做分類的時候,是做一個類似於線性的分類法,但是機器學習通常會有個共通點,就是需要我們人類給他特徵,然而這個特徵就是給機器學習在做分類時當作的一個指標,我們也可以稱為監督式學習。舉例來說,我們今天區分一個人是男生還是女生時,我們會觀察他的頭髮、眼睛、眉毛等部位(特徵)來判別,所以機器要去分辨我們人類也是同樣的道理,只是我們人類可以用看的,而機器不行,因為機器需要給他特徵。
所謂的機器學習,就是我們人類藉由0 或 1的方式來告訴機器,0代表頭髮、1代表眼睛等。
當我們今天要運用在網路偵測封包時,封包也有所謂的特徵,SVM會藉由我們給他的特徵來進行分類。
但在分類後我要怎麼看分的好或者不好呢?通常我們會運用到所謂的Precision and recall,然而Precision and recall會一起運用,例如我們今天預測這個人是男生,結果出來確定也是男生,所以模型的可信度就高。而Precision本身是算精確度,所以相較之下提高,recall則是看預測實際結果機率,所以通常量者會互補。
備註:Precision and recall通常可以運用到很多關於統計上,會用來評估模型的好壞。為什麼要這樣說呢?因為我們在做研究通常都是要客觀而不是主觀的判斷。做實驗總是要有憑據別人才會相信對吧!